블루 진
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
블루 진은 IBM이 개발한 슈퍼컴퓨터 시리즈로, 단백질 접힘 연구를 위해 시작된 프로젝트를 통해 탄생했다. 1999년 시작된 이 프로젝트는 블루 진/L, 블루 진/P, 블루 진/Q로 이어지며, 특히 블루 진/L은 2004년부터 2007년까지 세계에서 가장 빠른 슈퍼컴퓨터로 기록되었다. 블루 진 시리즈는 저전력 PowerPC 프로세서를 다수 사용하여 높은 병렬 처리 성능을 제공하며, 3차원 토러스 네트워크, 집단 통신 네트워크, 글로벌 배리어 네트워크 등 독자적인 네트워크 구조를 갖추고 있다. 블루 진/Q는 64비트 IBM A2 프로세서를 기반으로 하며, 세쿼이아, 미라, 쥬퀸 등 여러 주요 슈퍼컴퓨터에 채택되었다.
더 읽어볼만한 페이지
- 파워 마이크로프로세서 - 셀 (마이크로프로세서)
셀 마이크로프로세서는 소니, 도시바, IBM이 공동 개발한 멀티 코어 프로세서 아키텍처로, PPE와 SPE로 구성되어 EIB를 통해 연결되며, 플레이스테이션 3, 블레이드 서버, 슈퍼컴퓨터 등에 응용되었고 IBM 로드러너 슈퍼컴퓨터는 PowerXCell 8i 프로세서를 사용하여 1페타플롭스를 달성했다. - 파워 마이크로프로세서 - 파워8
POWER8은 IBM에서 빅 데이터, 데이터 분석, 클라우드 컴퓨팅 환경에 대응하기 위해 개발한 마이크로프로세서 아키텍처로, 최대 12개의 코어, 코어당 8개의 SMT, CAPI를 통한 확장성, 효율적인 전력 및 열 관리, 메모리 접근 최적화 등의 특징을 가진다. - 로렌스 리버모어 국립 연구소 - W70
W70은 1970년대 초 미국에서 개발된 전술 핵탄두로, 가변적인 핵출력을 가지거나 방사선 강화형으로 개발되었으며, 냉전 종식 후 폐기되었다. - 로렌스 리버모어 국립 연구소 - UGM-27 폴라리스
UGM-27 폴라리스는 미국 해군이 개발하고 운용한 잠수함 발사 탄도 미사일로, 제2격 능력 확보를 위해 개발되었으며 영국 해군에서도 운용되었으나 포세이돈과 트라이던트 I 미사일로 대체되었다. - 트랜잭셔널 메모리 - 스카이레이크 (마이크로아키텍처)
스카이레이크는 인텔이 2015년에 출시한 6세대 코어 i 시리즈 마이크로아키텍처로, 14nm 공정으로 제조되었으며 DDR4 메모리 지원, Gen9 GPU 통합, 다양한 제품군 출시 등의 특징을 가지지만 하이퍼스레딩 문제와 스펙터 공격에 대한 취약점도 존재한다. - 트랜잭셔널 메모리 - IBM Z
IBM Z는 높은 가용성과 하위 호환성을 특징으로 하는 IBM의 메인프레임 제품군으로, 과거 애플리케이션 실행은 물론 TCP/IP, 웹 서버, 리눅스 등 개방형 표준 지원과 64비트 어드레싱을 통해 현대적인 워크로드에 맞춰 발전했으며, z/Architecture 기반의 64비트 물리/가상 공간 지원, 다수의 프로세서 유닛, 다양한 운영 체제 지원을 주요 특징으로 한다.
블루 진 | |
---|---|
IBM 블루 진 | |
![]() | |
개발사 | IBM |
유형 | 슈퍼컴퓨터 플랫폼 |
최초 출시일 | BG/L: 1999년 2월 |
단종 | 2015년 |
이전 모델 | IBM RS/6000 SP |
후속 모델 | 서밋, 시에라 |
관련 모델 | ~ |
프로세서 | |
BG/L | PowerPC 440 |
BG/P | PowerPC 450 |
BG/Q | PowerPC A2 |
2. 역사
블루 진(Blue Gene) 프로젝트는 1999년 12월 IBM이 단백질 접힘과 같은 생체 분자 현상 연구를 위해 1억 달러를 투자하여 시작한 대규모 병렬 컴퓨터 개발 프로젝트이다.[8][9] 이 프로젝트는 윌리엄 R. 풀리블랭크(William R. Pulleyblank)가 이끌었으며, 토마스 J. 왓슨 연구 센터(Thomas J. Watson Research Center|IBM T. J. Watson Research Center)의 다학제 팀이 참여했다.[9]
주요 목표는 대규모 시뮬레이션을 통해 단백질 접힘 메커니즘을 이해하고, 대규모 병렬 머신 아키텍처 및 소프트웨어 분야의 새로운 아이디어를 탐구하는 것이었다. 초기 설계는 몬티 데노(Monty Denneau)가 설계한 사이클롭스64(Cyclops64) 아키텍처를 기반으로 했다.[16] 이후 앨런 가라(Alan Gara)가 QCDOC 아키텍처를 확장하는 작업을 시작했고, 미국 에너지부(United States Department of Energy|US Department of Energy)의 지원을 받아 블루 진/L(Blue Gene/L, L은 Light를 의미)로 발전했다. 원래 블루 진 아키텍처 개발은 블루 진/C(C는 Cyclops)를 거쳐 Cyclops64로 이어졌다.
2004년, 블루 진/L은 LINPACK 벤치마크에서 70.72 TFLOPS를 기록하며 세계에서 가장 빠른 슈퍼컴퓨터로 등극했다.[1] 이는 2002년부터 세계 최고 성능 슈퍼컴퓨터였던 NEC 지구 시뮬레이터를 넘어선 것이다. 2007년에는 후속 모델인 블루 진/P(Blue Gene/P)가 발표되었고,[22] 2011년에는 블루 진/Q(Blue Gene/Q)가 발표되어 성능과 효율성이 더욱 향상되었다.[39]
2009년, 블루 진은 미국 국가 기술상을 수상했다.[79]
2. 1. 로렌스 리버모어 국립 연구소의 시스템
로렌스 리버모어 국립 연구소(LLNL)는 블루 진 시리즈의 주요 협력 기관 중 하나로, 블루 진/L, 블루 진/P, 블루 진/Q를 도입하여 운영했다.2004년부터 LLNL에 설치된 블루 진/L[10]은 2008년 6월 IBM 로드러너(IBM Roadrunner)가 1 페타플롭스(PetaFLOPS)를 넘기 전까지 3년 반 동안 TOP500 목록에서 1위를 차지했다. 2004년 11월, 1,024개의 컴퓨팅 노드를 가진 16개 캐비닛 (컴퓨터)(cabinet (computer)) 시스템은 LINPACK 벤치마크 성능 70.72 TFLOPS로 TOP500 목록 1위를 차지하며, 2002년부터 세계 최고 성능 슈퍼컴퓨터였던 NEC 지구 시뮬레이터를 넘어섰다.[1] LLNL의 블루 진/L은 점차 확장되어 478 TFLOPS LINPACK과 596 TFLOPS 피크 성능을 달성했다.
블루 진/L은 3차원 분자 동역학 코드(ddcMD)를 사용해 용융 금속 응고를 시뮬레이션하여 실제 애플리케이션에서 100 TFLOPS 이상을 지속적으로 실행한 최초의 슈퍼컴퓨터였으며, 이 업적으로 2005년 고든 벨 상을 수상했다. 2006년 6월, 국립 핵안보청(National Nuclear Security Administration|NNSA)과 IBM은 블루 진/L이 양자 화학 애플리케이션(Qbox)에서 207.3 TFLOPS를 달성했다고 발표했다.[11]
2005년 6월, Blue Gene/L은 CPU 수를 65,536개로 늘려 136.80TFLOPS를 달성[75]했고, 2005년 10월에는 131,072개의 CPU로 280TFLOPS를 달성[76]했다. 2007년 11월 제30회 Top500에서는 CPU 코어를 212,992개로 늘려 478TFLOPS를 기록[77]하여, 당초 계획 목표였던 360TFLOPS를 달성했다.
비록 LLNL 설치가 가장 큰 규모였지만, 샌디에이고 슈퍼컴퓨터 센터를 포함한 여러 곳에 소규모 블루 진/L 시스템이 설치되었다. 2006년 11월 TOP500 목록에는 ''eServer Blue Gene Solution'' 아키텍처를 가진 27대의 컴퓨터가 있었다.
2. 2. 대한민국 도입
일본에서는 산업기술종합연구소 생명정보공학연구센터가 4개의 랙을 도입하여 2005년 6월 발표된 Top500에서 8위를 기록했다.[78] 이후 니이우스 주식회사에서 1개의 랙, 2006년에는 고에너지 가속기 연구 기구에서 10개의 랙 가동을 시작했다.3. 주요 특징
블루 진은 저전력 프로세서를 대규모로 병렬 연결하는 독특한 설계를 통해 높은 성능과 전력 효율을 동시에 달성하였다. 프로세서 속도를 낮추는 대신 전력 소비를 줄여 와트당 성능을 극대화했다.[17]
시스템 온 칩(System-on-a-chip) 설계를 통해 구성 요소를 단일 칩에 통합하여 전력 소비를 줄이고 안정성을 높였다. 512MB 외부 DRAM을 제외한 모든 구성 요소가 단일 칩에 내장되었다.[17]
또한, 블루 진은 노드 간 통신 효율성을 극대화하기 위해 3차원 토러스 상호 연결, 집단 통신 네트워크, 글로벌 배리어 네트워크 등 독자적인 네트워크 기술을 탑재했다.[17]
3. 1. 프로세서
블루 진은 개별 성능은 높지 않은 저전력 프로세서를 수십만 개 이상 탑재하여 병렬 실행 프로그램 수를 늘리는 방식으로 높은 성능을 실현하는 설계를 채택했다.[17] 초기 모델은 임베디드 시스템용 저전력 프로세서인 PowerPC 440 기반으로 설계되었다.[17] 각 블루 진/L 컴퓨트 노드는 2개의 700 MHz PowerPC 440 임베디드 프로세서를 탑재했다.[17] 듀얼 부동 소수점 장치(FPU)는 각 블루 진/L 노드에 이론상 최대 5.6 GFLOPS (기가플롭스)의 성능을 제공했다.[17]후속 모델인 Blue Gene/P에서는 PowerPC 450 기반 프로세서를 채택하여 성능을 향상시켰다.[22] 각 블루 진/P 칩은 850MHz로 작동하는 4개의 PowerPC 450 프로세서 코어를 포함한다.[22] 1 PFLOPS의 Blue Gene/P는 72개의 랙에 294,912개의 프로세서로 구성된다.[83]
모델 | 프로세서 | 코어 수 | 클럭 속도 | 최대 성능 |
---|---|---|---|---|
블루 진/L | PowerPC 440 | 2 | 700 MHz | 5.6 GFLOPS |
Blue Gene/P | PowerPC 450 | 4 | 850 MHz | 13.6 GFLOPS[22] |
3. 2. 네트워크
블루 진은 메시지 전달, 동기화 등 병렬 애플리케이션 특유의 프로그래밍 기법을 지원하는 독자적인 컴퓨터 네트워크를 탑재하고 있다.[17]- '''3차원 토러스 네트워크''': 노드 간 일대일 통신에 사용되며, 낮은 지연 시간과 광대역폭을 제공한다. 각 계산 노드는 인접한 6개의 노드와 양방향으로 연결되며, 노드 간 연결은 한 방향당 1.4G, 지연 시간은 100ns이다. 노드 수가 65,536개일 때 최대 홉 수는 64홉, 최대 지연 시간은 6.4µs이다.[17]
- '''집단 통신 네트워크''': 일대다 통신 및 파일 전송에 사용되며, 이진 트리 네트워크로 구성된다. 발신지에서 말단까지의 지연 시간은 최대 5µs이며 대역폭은 2.8G이다. 최대/최소값, 합계 등의 정수 연산 및 비트열 논리 연산에 의한 집약 기능이 있어, 다른 일반적인 슈퍼컴퓨터에 비해 지연 시간이 1/10에서 1/100 수준이다.
- '''글로벌 배리어 네트워크''': 하드웨어 지원을 통해 여러 노드의 동기화를 고속으로 수행한다. 65,536개 노드의 동기화에 필요한 시간은 1.5µs 미만이다.[17]
Blue Gene/L의 시스템 구성은 각 계산 노드에서 독립적으로 실행되는 프로세스가 네트워크를 통해 서로 데이터를 교환하는 메시지 전달 모델을 기반으로 설계되었다. 메시지 전달 인터페이스(MPI)를 지원하여, 기존 슈퍼컴퓨터용 병렬 애플리케이션을 이식하여 실행할 수 있다.[17]
3. 3. 도입 및 관리 비용
발열이 낮은 프로세서 채용과 주변 회로의 원칩화로, 설치 면적, 소비 전력, 냉각에 필요한 공조 설비 등에 드는 비용을 낮게 억제하였다.[17]4. 시스템 구성
블루 진은 사용자가 원하는 성능을 제공하기 위해 시스템의 최소 구성 단위인 랙을 여러 개 연결하여 구성한다. 각 랙에는 하나의 프로세스를 실행하는 최소 단위인 계산 노드가 여러 개 탑재되어 있으며, 이 노드들은 컴퓨터 네트워크로 연결된다.
블루 진/L의 랙에는 계산 노드 2개를 탑재하는 계산 카드가 512장 탑재되어 있어, 총 2048개의 CPU를 가진 머신으로 구성된다. 또한, 파일 시스템 접근을 담당하는 I/O 노드가 랙당 2개에서 64개까지 탑재된다. I/O 노드는 기가비트 이더넷을 통해 랙 외부의 파일 서버와 연결되며, 집단 통신 네트워크를 통해 계산 노드와 통신한다. 랙에 탑재되는 I/O 노드의 수는 실행하는 애플리케이션의 성격에 따라 조절된다.
4. 1. Blue Gene/L
블루 진/L은 블루 진 프로젝트의 첫 번째 컴퓨터로, 2004년에 세계에서 가장 빠른 슈퍼컴퓨터로 등극했다.[1] 2004년부터 2007년까지 로렌스 리버모어 국립 연구소(LLNL)에 설치된 블루 진/L[10]은 점차 104개의 랙으로 확장되어 478 TFLOPS LINPACK과 596 TFLOPS 피크를 달성했다. LLNL 블루 진/L 설치는 2008년 6월 IBM의 Cell 기반 IBM 로드러너(IBM Roadrunner) 시스템이 로스알라모스 국립 연구소에서 1 PetaFLOPS를 넘어선 최초의 시스템이 될 때까지 3.5년 동안 TOP500 목록에서 1위를 차지했다.블루 진/L의 랙 내에는 계산 노드 2개를 탑재하는 계산 카드가 512장 탑재되어 2048개의 CPU 머신으로 구성되어 있다. 랙당 2개에서 64개의 I/O 노드가 탑재되어 파일 시스템 접근을 담당한다. I/O 노드는 기가비트 이더넷으로 랙 외부의 파일 서버와 연결되며, 집단 통신 네트워크를 통해 계산 노드와 통신한다. 랙에 탑재하는 I/O 노드의 수는 실행하는 애플리케이션의 성질에 따라 조정된다.
4. 1. 1. 계산 노드
계산 노드는 하드웨어 고장을 줄이고, 고밀도 실장을 실현하기 위해 단순화된 구성을 가진다. 메모리를 제외한 구성 요소들은 SoC로 통합되어 하나의 집적 회로에 담겨, 실질적으로 두 개의 부품만으로 구성된다.[80]- '''PowerPC 440 기반 프로세서 x 2:''' 임베디드 시스템용 저전력 프로세서인 PowerPC 440을 기반으로 한 것을 2개 탑재하고 있다. 각 코어에는 각각 독립적인 배정밀도FPU와 L2 캐시가 부속되어 있으며, 2개의 코어 사이에서는 4MiB의 L3 캐시를 공유하고 있다.
- '''네트워크 인터페이스:''' 계산 노드 간 통신에 사용되는 Blue Gene 고유의 3차원 토러스 네트워크, 집단 통신 네트워크, 글로벌 배리어 네트워크와 기가비트 이더넷 인터페이스를 갖추고 있다.
- '''JTAG 인터페이스:''' 계산 노드의 진단 및 디버깅에 사용된다.
- '''메모리:''' 512MiB의 DDR SDRAM
4. 1. 2. 고밀도 실장
저전력 프로세서 채택은 고밀도 구현을 실현하기 위한 핵심 요소였다. 일반적인 PC나 서버, 그리고 기존의 슈퍼컴퓨터가 채용하는 고성능 프로세서는 소비 전력과 그에 따른 발열이 크기 때문에, 그러한 CPU를 케이스에 다수 탑재하면 발열 처리가 매우 어려워진다. 반면 케이스 내 밀도를 낮추면 케이블이나 연결 커넥터 등의 구성 부품이 늘어나 신뢰성 저하를 초래한다.블루 진/L은 소비 전력 대비 성능이 높은 임베디드용 프로세서를 도입하여 이러한 문제를 해결했다.[81] 이러한 설계 방침 덕분에 블루 진/L은 성능에 비해 전력 소비와 설치 면적이 매우 작은 시스템이 되었다. 블루 진/L의 소비 전력 당 성능은 112.24MFLOPS/W이며,[82] 지구 시뮬레이터의 3.01MFLOPS/W와 비교하면 37배나 전력 효율이 높다.
4. 1. 3. 네트워크
블루 진/L 내의 노드 연결에는 그 용도에 따라 다른 5종류의 네트워크가 사용되고 있다.3차원 토러스 네트워크는 낮은 지연 시간과 광대역폭을 요구하는 노드 간의 일대일 통신에 사용되며, 블루 진의 통신 네트워크 중 가장 중요한 위치를 차지한다.[17]
3차원 토러스 네트워크는 인접 노드 간의 연결로 구성되므로, 통신 상대에 따라 해당 통신 데이터가 여러 노드를 경유하여 도달하게 된다. 따라서 토러스 네트워크의 대역폭을 효율적으로 사용하기 위해서는 3차원 토러스에서의 통신을 최대한 국소적으로 억제하는 알고리즘을 적용할 필요가 있다. 또한, 통신 국소성을 블루 진의 물리적인 연결 배치에 맞추는 것도 중요하다.[17]
각 계산 노드 간의 연결은 한 방향당 1.4G bps, 지연 시간은 100 나노초가 된다. 각 노드는 인접한 6개의 노드와 각각 양방향으로 연결되어 있으며, 1개의 노드의 총 입출력 대역폭은 16.8Gbps에 달한다. 노드 수가 65,536개인 경우 토러스는 64x32x32가 되며, 최대 홉 수는 32+16+16=64홉, 최대 지연 시간은 6.4 마이크로초가 된다.[17]
집단 통신 네트워크는 특정 노드와 여러 노드 간의 일대다 통신 또는 파일 전송에 사용되며, 각 노드와 다른 1~3개의 노드 간의 상호 연결을 통한 이진 트리 네트워크로 구성된다. 발신지에서 말단까지의 지연 시간은 최대 5마이크로초이며 대역폭은 2.8Gbps이다.[17]
- 노드 처리 결과의 수집·집약: 현재 슈퍼컴퓨터용 병렬 애플리케이션에서는 각 노드의 처리 결과를 집약하는 작업에 많은 시간을 소비하고 있다. 이러한 특성을 감안하여 블루 진의 집단 통신 네트워크에는 최대/최소값, 합계 등의 정수 연산 및 비트열 논리 연산에 의한 집약 기능이 갖춰져 있다. 블루 진의 집단 통신 네트워크의 지연 시간은 다른 일반적인 슈퍼컴퓨터에 비해 1/10에서 1/100이며, 블루 진/L의 최대 구성 시에도 효율적인 집약 처리를 실현하고 있다.[17]
- 브로드캐스트: 특정 노드에서 여러 노드로 데이터를 브로드캐스트하는 데 집합 통신 네트워크가 사용된다. 3차원 토러스 네트워크에서도 브로드캐스트는 가능하지만, 네트워크 토폴로지 측면에서 집합 통신 네트워크가 훨씬 효율적이다.[17]
병렬 애플리케이션에서는 각 프로세스의 동기화가 자주 수행된다. 프로세서 수와 노드 수에서의 확장성을 확보하기 위해서는 동기화 대기로 인한 지연을 개선할 필요가 있다. 글로벌 배리어 네트워크에는 복수 노드의 동기화를 하드웨어의 지원을 통해 고속으로 수행하는 기구가 갖춰져 있다.[17]
이 배리어 네트워크는 저지연이라는 특징을 가지고 있으며, 65,536 노드의 동기화에 필요한 시간은 1.5마이크로초 미만이다.[17]
계산 노드의 초기화, 감시, 관리, 디버깅을 위해 이더넷과 JTAG 등의 인터페이스를 변환 회로를 통해 연결하는 네트워크가 마련되어 있다. 이 네트워크를 사용하여 관리용 컴퓨터에서 원격 제어를 수행한다.[17]
I/O 노드가 가진 기가비트 이더넷이 연결되는 네트워크로, I/O 노드 간의 통신과 외부 파일 서버에 대한 접근을 담당한다.[17]
4. 1. 4. 시스템 소프트웨어
계산 노드에서는 ''Compute Node Kernel''(CNK)이라는 독자적인 OS 커널이 작동한다. CNK는 멀티 유저를 지원하지 않으며, 동시 실행 스레드 수는 CPU 수와 같은 2개만 지원하고, 페이징 기능을 갖지 않으며 주소 공간은 512MiB로 고정하는 등 기능을 제한하여 OS 오버헤드를 줄였다.[17]CNK는 POSIX에 가까운 인터페이스를 가지고 있으며, 애플리케이션 개발자에게 GNU Glibc와 파일 I/O용 시스템 콜을 제공한다. I/O 처리는 CNK가 수행하는 것이 아니라, CNK의 요청을 받은 I/O 노드가 대신 실행한다. CNK의 이러한 제한으로 fork나 exec 등의 멀티 프로세스는 지원하지 않는다.[17]
I/O 노드에서는 I/O 노드 자체 장치를 지원하는 리눅스 커널 기반 커널을 채용하고 있다.[17] I/O 노드에서는 ''Control and I/O Daemon''(CIOD)이 작동하며, 계산 노드의 파일 액세스와 작업 제어를 수행한다. 계산 노드에서의 작업 실행은 I/O 노드가 프로그램을 계산 노드에 로드하고, 실행 시작 지령을 CNK에 내림으로써 시작된다. 작업 실행 중에는 I/O 노드가 CNK로부터 전송된 I/O 처리 의뢰를 실행한다.[17]
서비스 노드에서는 ''Core Management and Control System''(CMCS)이 작동한다. CMCS는 각 노드의 전원 투입, 온도 및 팬 등 감시와 이상 감지 시 긴급 셧다운, 노드 초기화 및 재설정 등을 담당한다.[17]
4. 2. Blue Gene/P
IBM이 2007년 6월 26일에 발표한 차세대 슈퍼컴퓨터로, 블루 진/L의 후속 모델이다. 지속적으로 1 PFLOPS로 가동되며, 최대 3 PFLOPS까지 확장 가능하도록 설계되었다. 각 칩에는 4개의 PowerPC 450 850MHz 프로세서가 탑재되어 있으며, 1 PFLOPS 시스템은 72개 랙에 294,912개의 프로세서로 구성된다. 최대 216개 랙, 884,736개 프로세서로 3 PFLOPS 성능을 낼 수 있다. 표준 구성에서는 1개 랙에 4,096개 프로세서를 수납한다.[22]블루 진/P는 소형 저전력 칩을 5개의 특수 네트워크로 연결하여 에너지 효율을 극대화했다. 371 MFLOPS/W의 성능으로 2007~2008년 Green500 목록 상위권에 올랐다.
최초의 시스템인 JUGENE은 독일 율리히 연구소(Forschungszentrum Jülich)에 2007년 11월 12일 설치되어 167 TFLOPS로 가동되었다.[83]
4. 2. 1. 설계
블루 진/P는 블루 진/L의 설계를 기술적으로 발전시킨 것이다. 각 컴퓨트 칩은 850MHz로 작동하는 4개의 PowerPC 450 프로세서 코어를 포함한다. 이 코어들은 캐시 일관성을 유지하며, 4-way 대칭형 멀티프로세서(SMP)로 작동한다. 칩의 메모리 서브시스템은 작은 개인 L2 캐시, 중앙 공유 8MB L3 캐시, 듀얼 DDR2 메모리 컨트롤러로 구성된다. 또한, 이 칩은 블루 진/L과 동일한 네트워크 토폴로지를 사용하지만 대역폭이 두 배 이상인 노드 간 통신을 위한 로직을 통합하고 있다.[22]컴퓨트 카드는 2GB 또는 4GB DRAM을 포함하는 블루 진/P 칩으로 구성되며, 이를 "컴퓨트 노드"라고 한다. 단일 컴퓨트 노드는 최대 13.6GFLOPS의 성능을 낸다. 32개의 컴퓨트 카드가 공랭식 노드 보드에 꽂히며, 랙에는 32개의 노드 보드(1024개 노드, 4096개 프로세서 코어)가 들어간다.[22]
4. 2. 2. 설치
2007년 6월, IBM은 슈퍼컴퓨터 Blue Gene 시리즈의 두 번째 세대인 '''Blue Gene/P'''를 공개했다. 2009년 11월 기준으로, TOP500 목록에는 2-랙 이상 규모의 Blue Gene/P 설치가 15개 포함되어 있었다.[1]
Blue Gene/P 설치 목록은 다음과 같다.
국가 | 기관명 | 설치년도 | 랙 수 | 기타 |
---|---|---|---|---|
독일 | 율리히 연구소(Forschungszentrum Jülich) | 2007년 | 16개 | JUGENE. 가동 당시 유럽 최고, 세계 6위 |
미국 | 아르곤 국립 연구소 | 2008년 | 40개 | "Intrepid". 2008년 6월 Top 500 3위 |
미국 | 로렌스 리버모어 국립 연구소 | 2009년 | 36개 | "Dawn" |
사우디 아라비아 | 킹 압둘라 과학 기술 대학교(KAUST) | 2009년 | 16개 | "Shaheen" |
미국 | 라이스 대학교 (상파울루 대학교 공동) | 2012년 | 6개 | |
네덜란드 | LOFAR 프로젝트 | 2.5랙 | ||
불가리아 | 불가리아 과학 아카데미, 소피아 대학교 | 2008년 | 2랙 | |
오스트레일리아 | 멜버른 대학교 | 2010년 | 2랙 | 빅토리아 생명 과학 계산 이니셔티브 |
뉴질랜드 | 캔터베리 대학교 | 2011년 | 2랙 | |
미국 | 럿거스 대학교 | 2012년 | 2랙 | "엑스칼리버" |
미국 | 로체스터 대학교 | 2008년 | 1랙 | 180TB 스토리지 |
브루나이 | 브루나이 다루살람 대학교(Universiti Brunei Darussalam) UBD-IBM Centre | 2010년 | 1랙 | 아세안 지역 최초 |
필리핀 | 국립 컴퓨터 센터 | 2013년 | 1랙 | |
일본 | 산업기술종합연구소생명정보공학연구센터 | 2005년 | 4랙 | 2005년 6월 Top500 8위 |
일본 | 니이우스 주식회사 | 1랙 | ||
일본 | 고에너지 가속기 연구 기구 | 2006년 | 10랙 |
4. 3. Blue Gene/Q
'''블루 진/Q'''는 블루 진 시리즈의 세 번째 모델로, 이전 모델인 블루 진/L 및 블루 진/P의 아키텍처를 확장하고 개선했다. 2011년에 발표되었으며, 20 PFLOPS(초당 2경 번의 부동소수점 연산) 달성을 목표로 했다.[1]블루 진/Q는 IBM A2 프로세서 코어를 기반으로 하며, 각 컴퓨트 칩은 1.6GHz로 작동하는 18개의 코어를 포함한다. 이 중 16개 코어는 연산에 사용되고, 나머지는 운영 체제 지원 기능 및 예비 용도로 활용된다. 칩은 32MB eDRAM L2 캐시와 16GB DDR3 DRAM을 갖추고, 45nm 공정으로 제조되어 전력 효율성을 높였다. 최대 성능은 204.8GFLOPS이며, 55와트의 전력을 소비한다.[39][40]
블루 진/Q는 1684 MFLOPS/Watt의 높은 전력 효율을 달성했다.[2] Q32 컴퓨트 드로어는 수냉식으로 32개의 컴퓨트 노드를 포함하며, 미드플레인은 16개의 Q32 컴퓨트 드로어로 구성되어 512개의 컴퓨트 노드를 수용한다. 랙은 두 개의 미드플레인을 포함하여 총 1024개의 컴퓨트 노드와 16,384개의 코어를 제공한다.[42]
블루 진/Q는 여러 기관에서 도입되어 운영되었다. 대표적인 예로는 로렌스 리버모어 국립 연구소의 "세쿼이아", 아르곤 국립 연구소의 "미라" 등이 있다. 세쿼이아는 2012년 6월에 16.32 PFLOPS의 성능으로 세계에서 가장 빠른 슈퍼컴퓨터로 선정되기도 했다.[1]
4. 3. 1. 설계
Blue Gene/Q "컴퓨트 칩"은 64비트 IBM A2 프로세서 코어를 기반으로 한다. A2 프로세서 코어는 4-way 동시 멀티스레딩을 지원하며 SIMD 쿼드 벡터 배정밀도 부동 소수점 형식 부동 소수점 연산 장치(IBM QPX)가 추가되었다. 각 Blue Gene/Q 컴퓨트 칩은 1.6GHz로 작동하는 18개의 A2 프로세서 코어를 포함하는데, 16개의 코어는 애플리케이션 컴퓨팅에 사용되고, 17번째 코어는 인터럽트, 비동기 I/O, MPI 페이싱 및 RAS와 같은 운영 체제 지원 기능을 처리하는 데 사용된다. 18번째 코어는 수율을 높이기 위해 사용되는 중복 제조 예비 코어이며, 시스템 작동 전에 비활성화된다. [39]칩의 프로세서 코어는 코어 속도의 절반으로 작동하는 32MB eDRAM L2 캐시에 크로스바 스위치로 연결된다. L2 캐시는 다중 버전으로, 트랜잭션 메모리 및 추측적 실행을 지원하며 원자 연산에 대한 하드웨어 지원을 제공한다.[39] L2 캐시 미스는 1.33GHz로 작동하는 2개의 내장 DDR3 메모리 컨트롤러에 의해 처리된다. 이 칩은 또한 2GB/s 칩 간 링크를 갖춘 5D 토러스 상호 연결 구성에서 칩 간 통신을 위한 로직을 통합한다. Blue Gene/Q 칩은 45nm에서 IBM의 구리 SOI 공정으로 제조된다. 이 칩은 약 55와트의 전력을 소비하면서 204.8GFLOPS의 최대 성능을 제공한다. 칩의 크기는 19×19mm (359.5mm²)이며 14억 7천만 개의 트랜지스터로 구성된다. 컴퓨트 노드를 완성하기 위해 칩은 16GB DDR3 DRAM (각 사용자 프로세서 코어당 1GB)과 함께 컴퓨트 카드에 장착된다.[40]
4. 3. 2. 설치

2012년 6월 기준으로 TOP500 목록에는 1/2 랙(512개 노드, 8192개 프로세서 코어, 86.35TFLOPS Linpack) 이상의 블루 진/Q 설치 시설이 20개 포함되어 있었다.[1] 이 시스템들은 약 2.1GFLOPS/W의 전력 효율성을 가지며, 2012년 6월 Green 500 목록 상위권에도 올랐다.[2]
다음은 블루 진/Q 설치 시설의 일부 목록이다.
- '''세쿼이아''': 로렌스 리버모어 국립 연구소(LLNL)에 2011년부터 납품되어 2012년 6월에 완전히 배치되었다. 핵 시뮬레이션 및 첨단 과학 연구를 수행하는 첨단 시뮬레이션 및 컴퓨팅 프로그램의 일부이다. 96개의 랙(98,304개 컴퓨팅 노드, 160만 개의 프로세서 코어, 1.6 PB 메모리)으로 구성되며 약 약 278.71m2의 면적을 차지한다.[44] 2012년 6월, 20.1 PFLOPS 피크, 16.32 PFLOPS 지속(Linpack) 성능으로 세계에서 가장 빠른 슈퍼컴퓨터로 선정되었으며 최대 7.9MW의 전력을 소비했다.[1]
- '''미라''': 2012년에 아르곤 국립 연구소의 아르곤 리더십 컴퓨팅 시설에 설치되었다. 48개 랙(49,152개 컴퓨팅 노드)과 70 PB의 디스크 저장 공간(470 GB/s I/O 대역폭)으로 구성된다.[47][48]
- '''벌컨(Vulcan)''': 로렌스 리버모어 국립 연구소(LLNL)에 설치된 24 랙, 5 PFLOPS(피크) 시스템으로, 2012년에 가동되어 2019년에 폐기되었다.[49] 리버모어의 고성능 컴퓨팅(HPC) 혁신 센터[50]를 통해 연구소-산업 프로젝트에 기여했으며, 미국 에너지부/국립 핵 안보청(NNSA) 임무를 지원하는 학술 협력에도 활용되었다.[51]
- '''DiRAC''': EPCC는 에든버러 대학교에 6 랙(6144-노드) 시스템을 운영하고 있다.[53]
- '''AMOS''': 렌슬러 폴리테크닉 연구소에 2013년에 설치된 5 랙 시스템이다.[54] 2014년에는 모든 사립 대학 중 가장 강력한 슈퍼컴퓨터였고, 모든 대학 중 세 번째로 강력한 슈퍼컴퓨터였다.[55]
- '''아보카(Avoca)''': 2012년 6월 빅토리아 생명 과학 컴퓨팅 이니셔티브에 설치된 838TFLOPS(피크) 시스템이다.[56] IBM과 VLSCI 간의 협업의 일부로, 진단 개선, 새로운 약물 표적 발견, 치료 개선, 질병에 대한 이해 증진을 목표로 한다.[57] 4개의 랙, 350 TB의 저장 공간, 65,536개의 코어, 64 TB RAM으로 구성된다.[58]
- '''로체스터 대학교''': 2012년 7월에 설치된 209TFLOPS(피크) 시스템이다.[59] [http://www.rochester.edu/provost/hscci/ Health Sciences Center for Computational Innovation]의 일부이며, 고성능 컴퓨팅을 건강 과학 분야의 연구 프로그램에 적용하는 데 전념하고 있다. 400 TB의 고성능 저장 공간을 갖춘 단일 랙(1,024개의 컴퓨팅 노드)으로 구성된다.[60]
5. 프로그래밍 모델
블루 진은 각 계산 노드에서 독립적으로 실행되는 프로세스가 네트워크를 통해 데이터를 교환하는 메시지 전달 모델을 상정한 설계로 되어 있다. MPI(Message Passing Interface)를 지원하여, MPI를 이용하여 구현된 기존 슈퍼컴퓨터용 병렬 애플리케이션의 이식을 용이하게 했다.[64]
그러나, 네트워크에서 언급한 것처럼 통신의 국소성이 부족하고, 처리 전체에서 통신 시간의 비율이 높은 것, 원래 병렬도가 낮은 애플리케이션에 대해서는, 보다 저지연 · 광대역 네트워크를 갖춘 다른 시스템에 비해 낮은 실행 효율밖에 얻을 수 없다. 블루 진은 통신에 대한 계산의 비율이 높은 애플리케이션일수록 유리하게 실행 가능하다.
참조
[1]
웹사이트
November 2004 - TOP500 Supercomputer Sites
https://www.top500.o[...]
2019-12-13
[2]
웹사이트
Green500 - TOP500 Supercomputer Sites
http://www.green500.[...]
2017-10-13
[3]
웹사이트
The Graph500 List
http://www.graph500.[...]
[4]
웹사이트
Obama honours IBM supercomputer
http://www.techradar[...]
2009-09-18
[5]
웹사이트
Supercomputing Strategy Shifts in a World Without BlueGene
http://www.nextplatf[...]
2017-10-13
[6]
웹사이트
IBM to Build DoE's Next-Gen Coral Supercomputers - EE Times
http://www.eetimes.c[...]
2017-10-13
[7]
기타
Supercomputing 2020 conference, Test of Time award video presentation
https://www.youtube.[...]
[8]
간행물
Blue Gene: A Vision for Protein Science using a Petaflop Supercomputer
http://www.research.[...]
2017-10-23
[9]
기타
A Talk with the Brain behind Blue Gene
http://www.businessw[...]
2001-11-06
[10]
웹사이트
BlueGene/L
http://asc.llnl.gov/[...]
2007-10-05
[11]
웹사이트
hpcwire.com
http://www.hpcwire.c[...]
[12]
웹사이트
SC06
http://sc06.supercom[...]
2017-10-13
[13]
웹사이트
HPC Challenge Award Competition
http://www.hpcchalle[...]
2006-12-03
[14]
뉴스
Mouse brain simulated on computer
http://news.bbc.co.u[...]
2007-04-27
[15]
웹사이트
IBM100 - Blue Gene
http://www-03.ibm.co[...]
2017-10-13
[16]
서적
Supercomputing: 28th International Supercomputing Conference, ISC 2013, Leipzig, Germany, June 16-20, 2013. Proceedings
https://books.google[...]
Springer
2017-10-13
[17]
간행물
Blue Gene
http://www.research.[...]
[18]
웹사이트
BlueGene/L Configuration
https://asc.llnl.gov[...]
2017-10-13
[19]
웹사이트
Compute Node Ruby for Bluegene/L
http://www.ece.iasta[...]
[20]
컨퍼런스
Python for High Performance Computing
http://us.pycon.org/[...]
2011-03-12
[21]
기타
Blue Matter source code
https://github.com/I[...]
[22]
웹사이트
IBM Triples Performance of World's Fastest, Most Energy-Efficient Supercomputer
http://www-03.ibm.co[...]
2011-12-24
[23]
간행물
Overview of the IBM Blue Gene/P project
2008-01
[24]
뉴스
Supercomputing: Jülich Amongst World Leaders Again
http://www.pressebox[...]
IDG News Service
2007-11-12
[25]
웹사이트
IBM Press room - 2009-02-10 New IBM Petaflop Supercomputer at German Forschungszentrum Juelich to Be Europe's Most Powerful
http://www-03.ibm.co[...]
03.ibm.com
2011-03-11
[26]
웹사이트
Argonne's Supercomputer Named World's Fastest for Open Science, Third Overall
http://www.mcs.anl.g[...]
2017-10-13
[27]
웹사이트
Rice University, IBM partner to bring first Blue Gene supercomputer to Texas
http://news.rice.edu[...]
2012-04-01
[28]
웹사이트
Вече си имаме и суперкомпютър
http://dnes.dir.bg/2[...]
Dir.bg
2008-09-09
[29]
웹사이트
IBM Press room - 2010-02-11 IBM to Collaborate with Leading Australian Institutions to Push the Boundaries of Medical Research - Australia
http://www-03.ibm.co[...]
03.ibm.com
2011-03-11
[30]
웹사이트
Rutgers Gets Big Data Weapon in IBM Supercomputer - Hardware -
http://www.informati[...]
2013-09-07
[31]
웹사이트
University of Rochester and IBM Expand Partnership in Pursuit of New Frontiers in Health
http://www.urmc.roch[...]
University of Rochester Medical Center
2012-05-11
[32]
웹사이트
IBM and Universiti Brunei Darussalam to Collaborate on Climate Modeling Research
http://www-03.ibm.co[...]
IBM News Room
2012-10-18
[33]
웹사이트
DOST's supercomputer for scientists now operational
http://www.philstar.[...]
2017-10-13
[34]
웹사이트
Topalov training with super computer Blue Gene P
http://players.chess[...]
2017-10-13
[35]
서적
Physics of the Future
Doubleday
2011
[36]
웹사이트
Project Kittyhawk: A Global-Scale Computer
http://www.research.[...]
2017-10-13
[37]
웹사이트
Project Kittyhawk: Building a Global-Scale Computer
http://weather.ou.ed[...]
IBM T.J. Watson Research Center
2018-03-13
[38]
웹사이트
Rutgers-led Experts Assemble Globe-Spanning Supercomputer Cloud
http://news.rutgers.[...]
2011-07-06
[39]
웹사이트
Memory Speculation of the Blue Gene/Q Compute Chip
http://wands.cse.leh[...]
2011-12-23
[40]
웹사이트
The Blue Gene/Q Compute chip
http://www.hotchips.[...]
2011-12-23
[41]
웹사이트
IBM Blue Gene/Q supercomputer delivers petascale computing for high-performance computing applications
http://www-01.ibm.co[...]
2017-10-13
[42]
웹사이트
IBM uncloaks 20 petaflops BlueGene/Q super
https://www.theregis[...]
2010-11-22
[43]
웹사이트
IBM announces 20-petaflops supercomputer
http://www.kurzweila[...]
Kurzweil
2011-11-18
[44]
웹사이트
Lawrence Livermore Prepares for 20 Petaflop Blue Gene/Q
http://www.hpcwire.c[...]
HPCwire
2009-02-03
[45]
웹사이트
NNSA's Sequoia supercomputer ranked as world's fastest
https://www.llnl.gov[...]
2012-06-18
[46]
웹사이트
TOP500 Press Release
http://www.top500.or[...]
[47]
웹사이트
MIRA: World's fastest supercomputer - Argonne Leadership Computing Facility
http://www.alcf.anl.[...]
2017-10-13
[48]
웹사이트
Mira - Argonne Leadership Computing Facility
http://www.alcf.anl.[...]
2017-10-13
[49]
웹사이트
Vulcan—decommissioned
https://hpc.llnl.gov[...]
2019-04-10
[50]
웹사이트
HPC Innovation Center
http://hpcinnovation[...]
2017-10-13
[51]
웹사이트
Lawrence Livermore's Vulcan brings 5 petaflops computing power to collaborations with industry and academia to advance science and technology
https://www.llnl.gov[...]
2017-10-13
[52]
웹사이트
Ibm-Fermi | Scai
http://www.hpc.cinec[...]
2013-05-13
[53]
웹사이트
DiRAC BlueGene/Q
https://www.epcc.ed.[...]
[54]
웹사이트
Rensselaer at Petascale: AMOS Among the World's Fastest and Most Powerful Supercomputers
http://news.rpi.edu/[...]
2017-10-13
[55]
웹사이트
AMOS Ranks 1st Among Supercomputers at Private American Universities
http://news.rpi.edu/[...]
2017-10-13
[56]
웹사이트
World's greenest supercomputer comes to Melbourne - The Melbourne Engineer
http://themelbournee[...]
2017-10-13
[57]
웹사이트
Melbourne Bioinformatics - For all researchers and students based in Melbourne's biomedical and bioscience research precinct
http://www.vlsci.org[...]
2017-10-13
[58]
웹사이트
Access to High-end Systems - Melbourne Bioinformatics
http://www.vlsci.org[...]
2017-10-13
[59]
웹사이트
University of Rochester Inaugurates New Era of Health Care Research
http://www.rochester[...]
2017-10-13
[60]
웹사이트
Resources - Center for Integrated Research Computing
http://www.circ.roch[...]
2017-10-13
[61]
웹사이트
EPFL BlueGene/L Homepage
http://bluegene.epfl[...]
[62]
웹사이트
À propos
http://www.cadmos.or[...]
2017-10-13
[63]
웹사이트
A*STAR Computational Resource Centre
https://www.acrc.a-s[...]
[64]
arXiv
The Universe at Extreme Scale: Multi-Petaflop Sky Simulation on the BG/Q
[65]
웹사이트
Cardioid Cardiac Modeling Project
http://researcher.wa[...]
2017-10-13
[66]
웹사이트
Venturing into the Heart of High-Performance Computing Simulations
https://str.llnl.gov[...]
2017-10-13
[67]
서적
Proceedings of the International Conference on High Performance Computing, Networking, Storage and Analysis
2013-11-17
[68]
뉴스
世界最速のスーパーコンピューターの開発に向け1億ドル規模の研究計画を発表 - 日本IBM
http://www-06.ibm.co[...]
[69]
뉴스
「Blue Gene」研究プロジェクト拡大を目的に米エネルギー省NNSAとIBMが提携 - 日本IBM
http://www-06.ibm.co[...]
[70]
뉴스
米エネルギー省向けに世界最速スーパーコンピューターを開発 - 日本IBM
http://www-06.ibm.co[...]
[71]
뉴스
IBM Blue Geneが最速スーパーコンピューター・リストで圧勝 - 日本IBM
http://www-06.ibm.co[...]
日本IBM
[72]
뉴스
IBMが科学発展の原動力となるスーパーコンピューターを発表 最大100ペタフロップス演算性能を誇るBlue Gene/Qで現代の難問解決を支援 - 日本IBM
http://www-06.ibm.co[...]
日本IBM
[73]
뉴스
新たな科学技術の発見のためのエンジンとなったIBM Blue Gene - IBMの生んだチェス・チャンピオン「Deep Blue」の子孫として -
http://www-06.ibm.co[...]
[74]
웹사이트
November 2004 TOP500 Supercomputing Sites
http://www.top500.or[...]
2007-10-24
[75]
웹사이트
June 2005 TOP500 Supercomputing Sites
http://www.top500.or[...]
2007-10-24
[76]
웹사이트
November 2005 TOP500 Supercomputing Sites
http://www.top500.or[...]
2007-10-24
[77]
웹사이트
November 2007 TOP500 Supercomputing Sites
http://www.top500.or[...]
2007-11-15
[78]
웹사이트
Computational Biology Research Center, AIST
http://www.top500.or[...]
2007-11-07
[79]
뉴스
IBM、Blue Geneで米国家技術賞を受賞 - ITmedia
https://www.itmedia.[...]
ITmedia
[80]
웹사이트
PowerPC 440 Embedded Core - IBM Microelectronics
http://www-01.ibm.co[...]
2007-10-24
[81]
간행물
Overview of the Blue Gene/L system architecture
http://researchweb.w[...]
[82]
웹사이트
The Green500 List
http://green500.org/[...]
2007-10-24
[83]
뉴스
Supercomputing: Jülich Amongst World Leaders Again
http://www.pressebox[...]
[84]
뉴스
Top500 Supercomputing List Reveals Computing Trends
http://www.serverwat[...]
[85]
뉴스
IBM Research A Clear Winner in Green 500
http://www.datacente[...]
[86]
뉴스
IBM uncloaks 20 petaflops BlueGene/Q super
http://www.theregist[...]
[87]
뉴스
US commissions beefy IBM supercomputer - IDG News Service
http://www.itworld.c[...]
IDG News Service
[88]
뉴스
Argonne National Laboratory Selects IBM Supercomputer to Advance Research - Based on next generation IBM Blue Gene, the 10 petaflop "Mira" supercomputer will fuel national innovation - IBM
http://www-03.ibm.co[...]
IBM
[89]
웹인용
Obama honours IBM supercomputer
http://www.techradar[...]
Techradar
2009-09-18
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com